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NSTL 集成 利用 第 三 方 来 源 元 数据 的 实践 
与 探索 


于 倩 倩 “” 张 建 勇 

(中 国 科 学 院 文献 情报 中 心 ” 北 京 100190) 

摘要 : 【 目的 ] 将 WOS、Scopus 等 第 三 方 来 源 元 数据 应 用 到 NSTL 加 工 系统 中 。[ 应 用 背景 ] 根据 NSTL 发 展 
规划 , 需要 从 单纯 自 加 工 扩展 到 加 工 以 及 协商 获取 、 购 买 第 三 方 元 数据 等 多 渠道 建设 元 数据 方式 。 [方法 】 以 
NSTL 加 工 规范 为 基础 ,实现 与 WOS 、Scopus 元 数据 的 映射 ， 分析 第 三 方 元 数据 特点 对 NSTL 加 工 规范 进行 局 
部 修订 并 映射 , 根据 映射 结果 , 将 第 三 方 元 数据 以 NSTL 加 工 规范 格式 输出 并 集成 到 NSTL 加 工 系 统 中 。[ 结果 】 
实现 第 三 方 来 源 元 数据 快速 、 高 效 、 低 成 本 地 集成 整合 到 NSTL 加 工 系统 。[ 结论 】 WOS 元 数据 在 NSTL 加 工 
系统 中 的 应 用 ,可 以 提高 NSTL 文献 数据 加 工 速度 。 有 针对 性 地 对 现 有 元 数据 加 工 规范 进行 修订 , 为 后 续 增 加 其 
他 第 三 方 资源 构建 了 拓展 框架 。 

关键 词 : Web of Science Scopus NSTL 元 数据 映射 

分 类 号 : G250.7 


三 方 来 源 元 数据 与 NSTL 文献 资源 元 数据 的 映射 ,并 
将 外 部 来 源 元 数据 资源 以 NSTL 元 数据 格式 输出 , 是 
NSTL 集成 利用 第 三 方 数 据 库 数 据 的 可 操作 方式 之 一 。 

Web of Science( 简 称 WOS) 数 据 库 局 、Scopus 数据 
库 多 是 国际 知名 的 数据 库 , 在 提供 文献 信息 服务 方面 
外 出 版 商 、 相 关 信 息 机 构 等 第 三 方 协 商 获取 、 交 换 、 。 与 NSTL 有 有 相同 之 处 。 本 文 在 分 析 WOS 元 数据 规 
赠与 、 早 缴 和 购买 等 多 渠道 建设 元 数据 资源 方式 。 范 、Scopus 元 数据 规范 和 NSTL 采用 的 文献 资源 加 工 
此 需要 在 NSTL 采用 的 文献 资源 元 数据 加 工 规范 四 ”规范 基础 上 ,结合 相关 实践 ， 以 期 刊 论文 为 例 , 对 三 
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国家 科技 图 书 文献 中 心 (NSTL)“ 十 三 五 "发展 规划 
提出 , 要 优化 国家 科技 文献 资源 保障 体系 , 拓展 元 数 
据 资源 采集 方式 。 为 此 ,要 整合 、 集 成 和 利用 第 三 方 
来 源 元 数据 ， 从 单纯 自己 加 工 扩 展 到 加 工 以 及 与 国内 


基础 上 ,深入 分 析 其 他 来 源 元 数据 的 类 型 特点 和 建设 。 者 的 元 数据 晓 别 内 容 、 映 别 效果 、 元 数据 描述 方式 进 


需求 ,建立 健全 NSTL 元 数据 规范 ,以 便 更 加 有 效 地 行 比较 , 并 提出 映射 及 利用 第 三 方 元 数据 过 程 中 需要 
集成 利用 第 三 方 来 源 元 数据 。 注意 的 问题 ， 以 期 为 相关 文献 信息 系统 的 元 数据 建设 
目前 , 不 同 的 文献 数据 库 , 元 数据 的 内 容 和 描述 ” 和 利用 已 有 第 三 方 来 源 元 数据 资源 提供 借鉴 。 

方式 存在 差异 ， 这 对 集成 和 利用 第 三 方 资源 产生 障 = 

得 。 元 数据 格式 的 多 样 性 与 NSTL 加 工 规范 需求 接口 。 2 网 刊 论文 元 数据 结构 

单一 性 之 间 的 冲突 , 使 得 第 三 方 来 源 元 数据 与 NSTL 根据 DC 元 数据 设计 的 模块 化 原则 趾 ， 并 结合 分 
文献 资源 元 数据 之 间 的 互 操作 成 为 必然 ,明确 外 部 。 析 WOS、Scopus、NSTL 三 个 文献 数据 库 的 元 数据 
来 源 元 数据 的 内 容 和 组 织 方 式 , 制订 相关 规则 实现 第 内 容 ， 期 刊 论文 元 数据 可 以 分 为 论文 元 数据 、 作 者 


通讯 作者 : 于 倩 倩 , ORCID: 0000-0001-8777-1171, E-mail: yuqianqian@mail.las.ac.cn。 
* 本 文系 NSTL 支持 项 目 “ 数 据 加 工 流程 调整 和 加 工 系 统 改 造 *( 项 目 编 号 :2014XM076) 的 研究 成 果 之 一 。 
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元 数据 、 作 者 机 构 元 数据 、 期 刊 元 数据 、 会 议 元 数 
据 、 基 金 元 数据 、 参 考 文献 元 数据 、 施 引文 献 元 数 
据 等 。 按 照 实体 分 析 法 ,期 刊 论文 实 体 间 的 关系 如 
图 1 所 示 , 一 篇 期 刊 论文 可 能 由 一 个 或 多 个 作者 所 
写 , 一 个 作者 属于 一 个 或 多 个 机 构 ， 论 文 发 表 在 期 
刊 上 ,可 能 来 自 于 某 个 会 议 ,也 可 能 挂靠 某 个 基金 ， 
可 能 具有 一 篇 或 多 篇 参考 文献 ， 也 可 能 被 一 篇 或 多 
篇 文献 引用 等 。 


参考 文献 施 引 文献 
+citation_ title +count 
ee 0. 玉 a 
作者 
tauthor_name 
和 I 1 


图 1 期 刊 论文 实体 关系 


三 个 数据 库 包 含 的 期 刊 论文 元 数据 类 型 有 所 不 
同 ,， 如 表 1 所 示 , 可 以 看 出 , WOS 、Scopus 对 8 类 元 数 
据 均 有 描述 , NSTL 缺乏 对 会 议 、 基 金 和 施 引 文献 元 数 
据 的 描述 。 原 因 主 要 是 : WOS 、Scopus 使 用 一 套 元 数 
据 Schema 描述 多 种 文献 类 型 如 期 刊 论文 、 会 议论 文 、 
图 书 、 专 利 等 。 因 此 ， 如果 期 刊 论文 中 涉及 到 会 议 、 
基金 信息 , 会 出 现 相关 描述 , NSTL 以 文献 类 型 为 基础 
划分 元 数据 Schema, 会 议 元 数据 包含 在 会 议论 文 
Schema 中 ; NSTL 加 工 规范 没有 对 基金 数据 、 施 引文 
献 数据 的 描述 。 

表 1 WOS、Scopus、NSTL 的 期 刊 论文 元 数据 


| | 
WOS V 6 V V VY a 5 V 
Scopus VV WY V V V VY V V 
NSTL V V Y YY YY 


3 ”元 数据 映射 与 比较 


以 NSTL 期 刊 论文 元 数据 (部 分 字段 是 必 备 
(Required) 字 段 ， 以 R 表示 ) 为 基础 , 对 比 WOS 、Scopus 
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在 论文 元 数据 、 作 者 /机 构 元 数据 、 期 刊 元 数据 、 参 考 
文献 元 数据 中 相同 字段 的 描述 内 容 和 方式 , 并 分 析 不 
同文 献 数据 库 元 数据 描述 的 特点 ,以 期 取长补短 ， 改 
善 NSTL 文献 资源 加 工 规范 元 数据 的 完整 性 和 兼容 
性 , 更 好 地 适应 和 支撑 对 各 类 第 三 方 来 源 元 数据 的 
集成 整合 。 

3.1 论文 元 数据 的 映射 比较 

NSTL 论文 描述 信息 是 期 刊 论文 描述 元 数据 规范 
的 主体 部 分 描述 的 内 容 包 括 论文 题名 、 关 键 词 、 文 
摘 和 分 类 信息 等 几 个 部 分 。WOS、Scopus 中 与 NSTL 
论文 描述 信息 等 同 的 字段 来 源 于 不 同 的 元 数据 模块 。 
例如 , WOS 中 题名 、 文 献 类 型 信息 来 源 于 论文 元 数据 ， 
起 页 、 止 页 、 总 页 数 来 源 于 期 刊 元 数据 ; Scopus 中 题 
名 、 摘 要 、 文 献 类 型 信息 来 源 于 论文 元 数据 , 起 页 、 
止 页 、 总 页 数 来 源 于 期 刊 元 数据 , 参考 文献 总 数 来 源 
于 参考 文献 元 数据 等 。WOS 、Scopus 与 NSTL 论文 元 
数据 映射 如 表 2 所 示 。 

从 表 2 可 以 看 出 , 在 22 个 NSTL 论文 元 数据 字段 
中 , WOS 有 12 个 字段 实现 映射 , Scopus 有 16 个 字段 实 
现 映射 , 不 同 的 第 三 方 来 源 元 数据 与 NSTL 元 数据 映 
射 数量 不 同 。 在 未 映射 的 字段 中 , 包含 了 必 备 字段 
paper id 和 local doi， 必 须 对 这 两 个 必 备 字段 进行 处 
理 才 能 将 映射 后 的 外 部 数据 源 数据 以 NSTL Schema 
格式 输出 , 例如 将 必 备 字段 输出 为 空 标签 。 

在 实现 映射 的 字段 中 , 同一 字段 在 不 同 数据 库 中 
取 值 、 字 段 可 重复 性 不 同 , 也 对 外 部 数据 源 数据 输出 
为 NSTL Schema 格式 造成 影响 。 例 如 , NSTL 的 type、 
WOS 的 doctype、Scopus 的 citation-type, 虽然 都 是 描 
述 文献 的 类 型 , 但 三 者 的 文献 类 型 枚 举 值 各 不 相同 ， 
需要 指定 WOS 、Scopus 枚 举 值 到 NSTL 文献 类 型 的 
映射 方式 。 

如 果 NSTL 字段 可 重复 , 外 部 数据 源 字段 不 可 
重复 ,直接 根据 映射 字段 取 值 即 可 。 如 果 NSTL 字 
段 不 可 重复 ,外 部 数据 源 字段 可 重复 ， 则 需要 指定 
解析 规则 从 外 部 数据 源 中 多 个 值 中 选择 一 个 作为 
NSTL 字段 唯一 值 。 例 如 将 Scopus 中 的 可 重复 字段 
citation-language xml: lang=“” 映 射 到 NSTL 中 的 不 
可 重复 字段 language, 可 设 定 为 取 第 一 个 citation- 
language 语种 字段 值 。 


从 表 2 还 可 以 看 出 , NSTL 通过 元 素 方式 进行 描 
述 , WOS .Scopus 多 用 属性 进行 描述 ,例如 题名 、 页 码 、 
参考 文献 数 都 采用 了 属性 限定 元 素 的 方式 , 更 好 地 对 


描述 内 容 进 行 归并 。 此 外 ,WOS 、Scopus 中 期 刊 论文 
都 具有 唯一 标识 符 , WOS 使 用 uid 元 素 唯一 标识 论文 ， 
Scopus 使 用 eid、pui、pii 等 唯一 标识 论文 。 


表 2 论文 元 数据 映射 
元 数据 标签 NSTL Schema WOS Schema Scopus Schema 
记录 号 paper_id(R) 二 本 
题名 title (R) title type="item” titletext original="“*y” 
其 他 语种 题名 alternative title type="foreign” titletext original="“n” 
文摘 abstract abstract_text abstract original="“y” 
其 他 语种 文摘 abstract_alternative abstract original="“n” 
关键 词 keyword keyword author-keyword 
其 他 语种 关键 词 keyword alternative 
主题 词 subject heading Subject mainterm 
主题 词 表 thesaurus descriptors controlled="“y” type="” 
分 类 号 classification classification 
分 类 法 classification Scheme classifications type=” 
正文 语种 language (R) language citation-language xml: lang="” 
其 他 语种 other_language 
起 页 start page (R) page begin=” pagerange first="” 
止 页 end_page page end="™ pagerange last="” 
总 页 数 total page number (R) page page_count="” pagecount 
参考 文献 总 数 total reference_number Tefs count="” refcount="” 
文献 号 paper_no 
本 地 唯一 标识 符 local doi (R) 2 各 
Dol doi identifier type= “doi” doi 
value="” 
论文 类 型 paper_type 
资源 类 型 type(R) doctype citation-type code="” 


通过 对 WOS 、Scopus 元 数据 描述 特点 分 析 ， 对 
NSTL Schema 进行 局 部 修订 ,以 属性 限定 元 素 的 方式 
添加 外 部 数据 源 论文 唯一 标识 字段 ， 与 外 部 数据 源 此 
字段 形成 映射 ， 例 如 添加 extend ids extend id type=” 
value=“”,， 通过 type 属性 与 外 部 数据 源 唯一 标识 映射 ， 
value 为 外 部 数据 源 唯 一 标识 取 值 , 一 方面 可 以 唯一 识 
别 来 自 于 外 部 数据 源 的 论文 , 与 自 加 工 数据 进行 区 分 ， 
另 一 方面 还 为 陆续 添加 其 他 数据 源 的 唯一 标识 提供 拓 
展 框架 。 

3.2 ”作者 /机 构 元 数据 的 映射 比较 

在 NSTL 中 , 作者 是 指 期 刊 论文 撰写 者 , 在 
WOS 、Scopus 中 , 论文 作者 与 出 版 者 、 图 表 制 作者 、 
翻译 者 等 共用 子 元 素 , 因此 需要 指定 角色 类 型 或 父 元 
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素 才能 实现 准确 映射 , 如 表 3 所 示 。 除 了 映射 元 素 外 , 
WOS、Scopus 中 都 有 对 作者 姓 、 名 、 通 讯 作者 、 机 构 
地 址 、 所 属国 家 和 城市 的 描述 ， 以 及 对 作者 唯一 标识 
符 如 ResearcherID 、ORCID 、AuthorID 等 的 描述 。 作 
者 唯一 标识 符 对 唯一 识别 作者 具有 重要 作用 ， 可 参考 
对 论文 唯一 标识 的 处 理 方式 ,为 NSTL 添加 外 部 数据 
源 的 作者 唯一 标识 提供 拓展 框架 。 

从 表 3 可 以 看 出 , 在 6 个 NSTL 作者 /机 构 元 数据 
字段 中 , WOS 、Scopus 均 有 5 个 字段 可 以 映射 ,映射 度 
较 高 。 也 存在 同一 字段 在 不 同 数据 库 取 值 类 型 不 同 的 
情况 , 例如 在 作者 顺序 字段 , NSTL 的 author_ sequence 
取 值 类 型 为 bytet, WOS 中 seq_no 取 值 类 型 为 positive 
Integer, 需要 协调 为 一 致 才能 真正 地 获取 数据 。 
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表 3 作者 /机 构 元 数据 映射 


元 数据 标签 NSTL Schema WOS Schema Scopus Schema 
作者 顺序 author_ sequence (R) name seq no=“” EH role="“author” author seq="” 
作者 姓名 author name(R) name(role="“author” addr_no="”) display_name author indexed-name 
其 他 形式 作者 姓名 author_name alternative ei wos_standird; author initials 
作者 所 属 机 构 affiliation address name address spec (addr no="”) organization affiliation organization 
其 他 形式 机 构 affiliation alternative 
作者 Email 地 址 email name(role="“author”) email addr author e-address type="“email” 


此 外 , 在 NSTL 中 顺序 描述 作者 和 机 构 信 息 , 在 ”包括 期 刊 描述 元 素 ( 见 表 4 中 前 14 个 字段 ) 和 卷 期 描述 
Scopus 中 以 机 构 为 基准 对 作者 进行 划分 , 在 WOS 数 元 素 ( 见 表 4 中 后 3 个 字段 ), 在 WOS 、Scopus 中 , 卷 
据 库 中 通过 addr no 属性 建立 作者 和 机 构 之 间 的 一 一 ”期 描述 元 素 包 含 在 期 刊 描述 元 素 中 。 除 了 表 4 中 的 映 
对 应 关系 。 如 果 作 者 姓名 Cname) 元 素 中 的 属性 addr no 射 字段 , WOS 包含 了 更 详细 的 期 刊 名 称 缩写 、 卷 期 出 
和 地 址 (address_spec) 元 素 中 的 属性 addr_no 相同 ， 则 版 日 期 和 出 版 商 地 址 信息 ，Scopus 还 描述 了 期 刊 唯 
表示 此 机 构 是 该 作者 的 机 构 。 这 样 , 不 管 作者 有 几 个 ” 标识 符 srcid、 文献 来 源 网 址 、 期 刊 编辑 者 信息 等 。 期 刊 、 


机 构 , 都 可 以 方便 地 实现 对 应 ,避免 重复 记录 。 卷 期 唯一 标识 符 对 唯一 识别 期 刊 、 卷 期 具有 重要 作用 ， 
ns, 3.3 ”期 刊 元 数据 的 映射 比较 可 同样 参考 论文 唯一 标识 的 处 理 方式 , 为 NSTL 添加 外 
TT 期 刊 是 期 刊 论文 的 载体 , 在 NSTL 中 期 刊 元 数据 部 数据 源 的 期 刊 、 卷 期 唯一 标识 提供 拓展 框架 。 
六 ~ 表 4 ”期刊 元 数据 映射 
元 数据 标签 NSTL Schema WOS Schema Scopus Schema 

母体 数据 源 编号 catalog_code(R) --- 

订购 号 subscription number 

ISSN issn identifier type="issn” issn type= “print” 

EISSN eissn identifier type="“eissn” issn type="“electronic” 

CODEN coden codencode 

国内 统一 书刊 号 cn identifier type="“cn” 

母体 文献 名 称 host title(RJ) title type=source” sourcetitle 

其 他 语种 母体 文献 名 称 host title_ alternative translated-sourcetitle 

语种 host language(R) --- 

母体 文献 分 类 号 host _ classification 

出 版 地 publishing_place publisher address_spec city publisher affliation city 

出 版 者 publisher publisher name (role="“publisher”)display_name publishername 

起 始 年 start year(R) a 

终止 年 end year 

卷 期 出 版 年 year(R) pub_info pubyear="” publicationyear first="™ 

卷 信 息 volume pub_info vol="™ voliss volume="” 


由 位 自 2 pub_info issue="” part_no="” supplement="” Ce a 
期 信息 issue es 说 voliss issue="” supplement 
special issue= 


在 NSTL 期 刊 元 数据 17 个 字段 中 ,WOS 有 9 个 字 ”上段 处 理 方式 。NSTL 中 的 一 个 元 素 可 能 对 应 于 WOS、 
段 实现 映射 , Scopus 有 10 个 字段 实现 映射 ， 对 于 未 映 Scopus 中 的 多 个 元 素 或 同一 元 素 中 的 多 个 属性 。 例 如 
射 的 必 备 字段 处 理 方式 同 论文 元 数据 未 映射 的 必 备 字 ”在 NSTL 中 , 只 有 期 信息 issue 字段 , 没有 划分 增刊 、 
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特刊 、 分 期 字段 , 但 指定 了 这 些 字段 在 期 信息 字段 中 
的 著录 规则 ,如 有 期 号 ,但 该 期 又 分 为 若干 分 期 的 ， 
分 期 前 缀 照 录 , 增刊 .专刊 填写 在 期 号 后 ， 若 无 期 号 则 
直接 填写 增刊 信息 等 ,可 根据 这 些 著录 规则 对 WOS、 
Scopus 相应 数据 进行 数据 抽取 合并 。 
3.4 ”参考 文献 元 数据 的 映射 比较 

在 NSTL 中 , 参考 文献 内 容 包 括 引文 作者 、 题 名 、 
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出 处 、 卷 期 以 及 获取 访问 路 径 等 。 参 考 文献 信息 可 以 
让 用 户 从 作者 研究 脉络 角度 查找 到 一 组 相关 文献 "1。 
WOS 包含 了 参考 文献 中 的 作者 、 题 名 、 刊 名 、 卷 、 页 
言 息 , 没有 参考 文献 原始 信息 字段 ，Scopus 既 包含 了 
原始 信息 字段 , 也 包含 了 作者 、 题 名 等 拆 分 字段 。 三 
者 参考 文献 元 数据 映射 如 表 5 所 示 , 对 于 未 实现 映射 
的 必 备 字段 处 理 方式 同 前 。 


表 5 参考 文献 元 数据 映射 


元 数据 标签 NSTL Schema WOS Schema Scopus Schema 
引文 类 型 citation_ type(R) 
引文 原始 信息 citation orig info(R) ref-fulltext 
引文 第 一 作者 citation authorl citedAuthor ref-authors author seq="1” 
引文 第 二 作者 citation author2 ref-authors author seq="2” 
引文 第 三 作者 citation author3 ref-authors author seq="3” 
引文 题名 citation title citedTitle ref-titletext 
引文 出 处 citation sourcetitle citedWork ref-sourcetitle 
引文 出 版 外 citation_year reference year ref-publicationyear first="” 
引文 卷 号 citation Volume reference volume ref-volisspag voliss volume="” 
引文 期 号 citation_issue ref-volisspag voliss issue=""” 
引文 页 citation page reference page ref-volisspag pagerange first="” last="” 
引文 主 名 citation editor in chief 
引文 出 版 者 citation publisher 
链接 地 址 citation_url 


4 元 数据 映射 方式 的 优势 和 不 足 


通过 对 WOS、Scopus 与 NSTL 元 数据 的 映射 ， 可 
以 看 出 , 在 大 部 分 元 数据 字段 上 WOS、Scopus 可 以 实 
现 与 NSTL 元 数据 的 映射 ， 而 且 这 些 字段 属于 比较 重 
要 的 字段 。 总 体 来 说 , 通过 元 数据 映射 可 以 实现 外 部 
数据 源 数据 到 NSTL 数据 的 准确 转换 , 而且 效 率 较 高 。 
因此 , 元 数据 映射 是 实现 NSTL 集成 利用 第 三 方 来 源 
元 数据 的 可 行 方式 和 有 效 方式 。 元 数据 字段 映射 的 数 
量 越 多 ， 外 部 数据 源 数据 利用 越 充 分 。 

通过 元 数据 映射 的 方式 , 还 可 以 了 解 到 其 他 数据 
库 元 数据 字段 的 描述 方式 , 与 自 有 元 数据 规范 进行 比 
较 , 取长补短 ,提高 自 有 元 数据 的 完整 性 和 兼容 性 ,。 通 
过 对 WOS、Scopus 元 数据 的 分 析 和 与 NSTL 元 数据 
的 映射 , 针对 性 地 对 现 有 NSTL 元 数据 Schema 进行 修 
订 。 例 如 增加 外 部 数据 源 数据 唯一 标识 、 修 改元 数据 
取 值 类 型 等 ,可 以 快速 、 高 效 、 低 成 本 地 将 外 部 数据 


源 如 WOS 数据 集成 到 NSTL 联合 数据 加 工 系统 中 , 也 
为 后 续 增 加 其 他 第 三 方 资源 构建 了 拓展 框架 。 

元 数据 映射 方式 虽然 解决 了 三 者 数据 库 在 信息 组 
织 方 式 和 内 容 揭 示 方 式 上 的 部 分 差异 , 但 依然 存在 局 
限 性 , 例如 , 无 法 避免 未 能 实现 全 部 字段 映射 造成 的 
目标 信息 丢失 问题 , 会 影响 NSTL 加 工 数据 的 全 面 性 
和 完整 性 。 又 如 ,元 数据 描述 的 详 略 差异 造成 的 源 信 
息 丢 失 问 题 , WOS 、Scopus 对 作者 、 机 构 、 期 刊 等 有 
更 多 较为 详细 的 描述 字段 , 在 NSTL 中 没有 体现 ,这 
些 字段 对 文献 资源 的 揭示 更 加 细 上 颗粒 化 , 通过 元 数据 
映射 输出 的 方式 , 造成 外 部 数据 源 数据 的 丢失 。 


S 结 语 


在 当前 不 同文 献 数 据 库 元 数据 描述 字段 不 尽 相 同 
的 情况 下 ， 如 果 相 互 之 间 的 元 数据 能 够 进行 映射 ， 对 
实现 不 同 数据 库 之 间 的 数据 交互 和 流转 具有 重要 意 
义 , 元 数据 字段 映射 数量 越 多 , 数据 越 能 得 到 充分 利 
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应 用 认 


用 。 本 文 以 WOS、 Scopus 与 NSTL 期 刊 论文 元 数据 (Sa Lei. Study in Metadata Interoperability [J]. Information 
的 映射 为 基础 ,描述 了 NSTL 集成 利用 第 三 方 来 源 元 Science, 2014, 32(1): 36-40.) 

数据 的 流程 和 方法 ， 并 提出 元 数据 映射 及 集成 第 三 方 [5] Web of Science [EB/OL]. [2014-05-08]. http://www.webof- 
元 数据 过 程 中 需要 注意 的 问题 。 目 前 , NSTL 已 将 购买 es 


ww i 放下 ap 人 [6] Scopus [EB/OL]. [2014-06-18]. https:/www.scopus.cony. 
的 WOS 数据 应 用 于 数据 加 工 过 程 中 , 陆续 还 会 增加 
[7] The Singapore Framework for Dublin Core Application 


6 yy My 人 a YY = 浅 | A 年 三 
对 其 他 数据 源 的 数据 应 用 ， 这 对 提升 数据 加 工 的 速度 Profiles [EB/OL]. [2015-05-08]. http://dublincore.org/docu- 
和 系统 的 自动 化 水 平 大 有 神 益 。 ments/singapore-framework/. 


[8] NSTL journalarticle.xsd [EB/OL]. [2015-05-20]. http://spec. 
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Practices of NSTL Integrating and Using Third-party Metadata 


Yu Qianqian Zhang Jianyong 

(National Science Library, Chinese Academy of Sciences, Beijing 100190, China) 
Abstract: [Objective] To apply the third-party source metadata such as Web of Science metadata to NSTL joint data 
processing System. [Context] Based on NSTL Development Program, need to expand process metadata by oneself to 
acquire metadata in various ways such as buying third-party metadata. [Methods] Map Web of Science, Scopus Schema 
to NSTL Schema, analyze the characteristics of Web of Science metadata to revise NSTL Schema. Based on mapping 
results, export third-party metadata as NSTL Schema format and integrat it into NSTL joint data processing system. 
[Results] Integrate the third-party metadata into NSTL joint data processing system rapidly and efficiently. 
[Conclusions] The apply of Web of Science metadata in NSTL joint data processing system has improved the data 
processing speed. Revising existing NSTL Schema targeted constructs widen fremwork for adding other third-party 
metadata. 
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